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Jj 要 : 在线 评分 行为 的 动态 研究 能 够 帮助 深入 理解 社交 网 络 用 户 集群 行为 和 信任 关系 的 演化 机 制 ， 当 前 许多 在 线 系 
统 用 户 能 够 通过 对 物品 进行 评分 传达 自己 的 观点 。 通 过 去 趋势 波动 分 析 研 究 了 用 户 评分 行为 在 信任 关系 建立 前 后 的 长 
记忆 效应 ， 并 通过 随机 化 打分 时 间 和 信任 时 间 建 立 堆 模型， 最 后 进行 用 户 打 分 行为 异 质 性 分 析 。 采 用 Epinions 数据 集 
进行 实证 研究 , 结果 表明 用 户 打 分 的 长 记忆 效应 在 信任 关系 建立 前 出 现下 降 趋 势 (8.06%), 并 于 之 后 逐步 回升 (8.43% )， 
而 在 两 个 零 模 型 中 则 分 别 稳 定 在 0.5 和 0.6 左右 ， 且 用 户 长 记忆 效应 变动 与 用 户 度 呈 正 相 关 ，Pearson 相关 系数 分 别 为 
0.9358 和 0.9278。 该 工作 有 助 于 深入 理解 用 户 集群 行为 和 信任 关系 的 动态 演化 机 制 。 
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Study of long-term memory in online rating behavior for trust formation 
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Abstract: Investigating the dynamics of long-term memory in online rating behaviors is significant for understanding the 
evolution mechanism of collective behaviors and trust formation for online social networks. Since users are allowed to deliver 
ratings in many online systems, ratings can well reflect the user’s opinions. This paper empirically investigated the long-term 
memory, measured by the Detrended Fluctuation Analysis, in collective rating behaviors before and after the trust formation. 
The results for the Epinions data set show that, comparing with the null model generated by the reshuffle process, the Hurst 
exponent of trustors decreases 8.06% before and increases 8.43% after trust formation, which stably remains close to 0.5 in null 
model I and 0.6 in null model II, suggesting that the collective rating behavior plays an important role for the trust formation. 
Furthermore, the paper divided users into 8 groups according to the user degree and find that the correlation of the user degree 
and the variation of Hurst exponent, measured by the Pearson Correlation Coefficient, is 0.9358 and 0.9278 before and after 
trust formation respectively, reflecting a significant correlation between user degrees and collective rating behavior patterns. 
This work helps deeply understand the intrinsic feedback effects between collective behaviors and trust relationship. 
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Nu 气 出 了 许多 特别 的 集群 行为 模式 自 。 比 如 :用户 打分 行为 的 时 

0 alg 闻 间 隔 呈 现 阵 发 性 ， 即 用 户 倾向 于 短 时 间 内 爆发 大 量 打分 行为 

近年 来 ， 互 联网 的 飞速 发 展 催生 了 许多 新 兴 的 在 线 系统 ， 后 经 历 长 时 间 的 沉寂 或 长 时 间 内 只 进行 少量 打分 富 下 99。 

使 得 人 们 可 以 方便 地 进行 购买 、 评论、 社交 等 线 上 行为 同时 ， 为 尝试 解释 这 种 打分 行为 的 阵 发 性 ， 研 究 者 相继 提出 了 基于 任 

也 为 研究 在 线 用 户 的 行为 模式 、 兴 趣 偏好 等 提供 了 丰富 的 数据 ” 务 的 排队 论 模型 “二 ”以 及 兴趣 驱动 模型 “二 ”等 。 与 

pta. 之 相反 的 是 , 用 户 打分 行为 本 身 存在 记忆 效应 “38 g 

传统 的 社会 学 和 心理 学 方法 在 收集 数据 、 处 理 数据 等 方面 。” 究 表明 , 在 线 用 户 行为 存在 “ 铺 定 效应 ,而 马尔 可 夫 

有 一 定 的 局 限 性 中 ， 如 收集 个 人 社交 关系 数据 的 隐私 问题 ， 收 ”模型 则 被 广泛 应 用 于 研究 这 种 短 记忆 效应 9。 同时, 在 
集 长 时 间 行 为 数据 的 成 本 问题 和 准确 性 问题 等 。 基 于 问卷 调查 。” 线 用 户 集群 行为 还 存在 长 记忆 效应 下 人。 

的 研究 ， 还 会 受到 访问 者 效应 ， 召 区 向 值得 注意 的 是 , 以 上 集群 行为 研究 成 果 并 未 考虑 社交 因素 。 


o 


率 等 问题 的 影 


利用 统计 物理 学 方法 ， 研 究 者 在 海量 的 在 线 用 户 数据 中 挖 EER Epinions 的 在 线 系统 中 ， 用 户 既 可 以 通过 打分 表示 
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录用 稿 


个 人 偏好 ， 又 可 以 通过 建立 信任 关系 对 其 他 用 户 表示 信任 ， 使 
得 研究 者 可 以 同时 获得 用 户 的 行为 数据 和 信任 关系 数据 并 
两 者 之 间 的 关 ES 

本 文通 过 去 趋势 波动 分 析 法 研究 用 户 扣 
效应 在 建立 信任 关系 前 后 的 动态 变化 。 通 过 实证 
间 数 在 建立 信任 关系 前 的 迅速 减 小 和 之 
机 化 零 模型 中 赫 斯 特 指数 稳定 不 变 对 比 可 发 现 ， 用 户 打分 行为 
在 建立 信任 关系 前 后 发 生 了 显著 变化 ， 长 记忆 效应 经 历 了 先 减 
弱 后 恢复 的 过 程 ， 与 信任 关系 建立 存在 着 显著 的 内 在 关联 性 ， 
且 此 波动 现象 与 用 户 度 呈 正 相 关 。 本 文 从 宏观 实证 角度 的 研究 ， 
有 利于 进一步 深入 理解 在 线 用 户 集群 行为 以 及 在 线 信任 关系 的 
动态 演化 机 制 。 


1 ”相关 理论 


长 记忆 效应 
长 记忆 效应 又 称 做 长 程 相关 性 ， 通 常用 来 表示 时 间 序 列 中 
。 用 户 评分 行为 中 的 长 


Jù 


分 行为 中 的 长 记忆 
数据 中 赫 斯 特 
后 的 逐渐 增 大 ， 以 及 随 


M NS 


1.1 


PR ze] Ev AR A p z Sp Rm 
记忆 效应 意味 着 用 户 偏好 具有 可 预测 性 ， 而 这 一 性 质 则 有 助 于 


改善 推荐 系统 , 并 提供 更 好 的 线 上 服务 "长程 相关 性 
通常 以 指数 衰减 作为 临界 值 ， 即 行为 时 间 序 列 中 两 点 之 间 的 统 
计 相关 性 会 随 着 两 点 之 间 的 时 间 间 隔 增 长 而 衰减 ， 其 衰减 速度 
比 指数 衰减 要 慢 ， 并 呈 窜 律 衰减 的 时 候 ， 则 称 此 行为 时 间 序 列 
具有 长 记忆 效应 。 
1.2 Ahit (Hurst) 指数 
赫 斯 特 指 数 被 广泛 运用 于 衡量 时 间 序 列 变量 的 长 记忆 效应 
Baskwssum. 。 赫 斯 特 指 数 的 取 值 范围 为 具体 取 值 情况 如 下 : a 
当 H-0.5 时 , 该 时 间 序 列 没有 相关 性 ， 即 为 随机 时 间 序 列 ; b) 
当 0.5<H<1 时 ， 该 时 间 序 列 具 有 一 致 性 ， 意 味 着 如 果 现 在 评分 
时 间 序 列 中 用 户 一 直 打 高 分 ， 则 接 下 来 很 可 能 继续 打 高 分 ， 反 
之 如 果 用 户 一 直 打 低 分 ， 则 接 下 来 用 户 很 可 能 继续 打 低 分 ; c) 
当 0<H<0.5 时 ,该 时 间 序 列 具 有 反 一 致 性 , 意味 着 如 果 现 在 评分 
序列 中 用 户 一 直 打 高 分 ， 则 接 下 来 很 可 能 打出 低 分 ， 反 之 如 果 
现在 评分 序列 中 用 户 一 直 打 低 分 ， 则 接 下 来 很 可 能 打出 高 分 。 
赫 斯 特 指数 起 初 以 英国 水 文学 家 哈 罗 德 - 赫 斯 特命 名 , 并 被 
用 来 分 析 尼 罗 河 雨季 旱季 多 变 情 况 下 的 最 佳 大 坝 容 量 和 As 
”。 最 初 被 用 来 计算 赫 斯 特 指数 的 R/S 分 析 法 在 分 析 非 平稳 时 
间 序 列 时 无 法 确保 其 准确 性 。 在 分 析 非 平稳 时 间 序 列 时 ， 去 除 
时 间 序 列 中 的 趋势 十 分 重要 和 和 % 丰 坟 到 引用 党 ,| 办 此，Peng Aj PATR 
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均 打 分 (F = LED in) 


进而 将 转换 后 的 序列 BC) yQ),.. 


,;y(N)} 划 分 为 等 长 度 (s) 


的 n 个 时 间 窗 


在 每 个 时 间 窗 口中 进行 最 小 二 乘法 拟 合 数 


据 , 拟 合 的 


线 即 为 所 在 窗口 的 “趋势 * 


(xX)( 如 图 1(b) 所 示 )。 


SS 


打分 序列 尺 转 


化 序列 y(x) 及 其 分 段 拟 合 曲线 


AI s 在 双 对 数 和 


& 标 下 的 线性 相关 关系 ， 


图 1 DFA 过 程 示例 Ca) 


ih lli 


Yn 


40 80 120 
Rating Number, i 


160 


1.6 
log s 


2.0 24 


长 度 为 N=200 的 某 用 户 打 分 时 间 序 列 R (b) 
(时 间 窗 口 长 度 s=20) Ce) F(s) 
以 合 曲线 斜率 即 为 所 求 蒜 斯 特 指数 


接着 ,按照 式 OO 去 除 序列 y(x) 中 的 趋势 


整个 计算 过 程 重复 于 所 


计算 其 均 方 根 


F(s) = EDOR D 


时 间 标 度 以 得 到 F(s) 和 时 间 窗 口 大 小 


s ZAREK, WR G) 所 示 。 


4 


其 中 : H BIA 
s 在 双 对 数 4 


如 式 (4) 所 示 。 


F(s)~s” (3) 


有 特 指数 。 如 图 1 Cc) 所 示 ， 即 可 得 到 F(s) 和 


ANS 


的 线性 相关 关系 ,及 即 为 相关 关系 的 斜率 ， 


logF(s)~Hlogs (4) 


2.2 用 户 集群 评分 行为 的 长 记忆 效应 


计算 用 


PR 


BIRM. 提出 了 去 趋势 波动 分 析 法 (DFAO. WS, DFA 由 于 能 够 

有 效 甄别 来 源 和 形状 均 未 知 的 噪声 序列 ， 而 被 广泛 运用 于 研究 

非 平稳 时 间 序 列 中 的 长 记忆 效应 091。 

2 用户 评 分 序列 长 记忆 效应 分 析 

2.1 ”去 趋势 波动 分 析 法 DFA) Rr 
本 文 使 用 标准 DFA 计算 用 户 评分 行为 的 赫 斯 特 指数 , 此 处 

以 评分 时 间 序 列 R = (rro, .7w} 为 例 。 首 先 将 R (序列 长 度 为 

N = 200， 如 图 1 GO 所 示 ) 按照 式 (1) 进行 转换 ， 表 示 为 得 。 


yx) = Xizri —7) a) 
其 中 x = 1,2, .…, N, 7 为 第 i 个 打分 , 7 为 习 


R 


如 图 


1 (b) 所 示 ， 


X OD - (4) 可 计算 用 
户 i 每 周 打分 序列 的 RE(At) 中 的 长 记忆 效应 。 因 此 ， 
的 平均 赫 斯 特 指数 (H*(At))1 


户 i 的 赫 斯 特 指数 HP (AD. MAT 


X CO 计算 可 得 。 


(HUD) = BEHAD (5) 


NB 为 信任 关系 总 数 。 
0 时 刻 的 平均 赫 
3 天 、 后 3 天 以 及 建立 信任 关系 当天 


有 特 指数 (HY*(At)) 由 用 户 建立 信任 关系 前 
E 7 天 的 评分 记录 计算 而 
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: T 
录用 入 nus, g: aane na AVAE y 
3 实验 结果 与 分 析 K 1 用 户 建立 信任 关系 前 后 (H*(At)) 随 时 间 的 变化 
At (H"(At)) At (H" (At)) 

3.1 实验 数据 0 0.5716 0 0.5716 

本 文 使 用 的 实验 数据 是 Epinions 数据 集 。 在 Epinions 网 站 -1 0.5858 1 0.5823 
上 ， 用 户 可 以 对 商品 〈 包 括 汽 车 ， 书 籍 ， 电 影 ， 软 件 等 ) 进行 E, 0.5967 2 0.5941 
评论 , 还 可 以 对 其 他 用 户 的 评论 进行 打分 , 1-5 分 分 别 表示 用 户 E 0.6019 3 0.6020 
对 该 评论 的 五 种 认同 程度 一 一 “没有 帮助 ““ 稍 有 帮助 “有 帮 E 0.6106 4 0.6116 
助 “ 比 较 有 帮助 “最 有 帮助 "。 同时， 用 户 可 以 与 其 他 用 户 建立 js WEISE 5 WES 
信任 关系 ， 也 就 是 说 ， 用 户 可 以 选择 信任 那些 他 们 认为 评论 和 T 6 — 
打分 一 贯 具 有 价值 的 用 户 。Epinions 数据 集 同 时 包含 信任 关系 -— 7 "— 
和 打分 行为 信息 ， 为 分 析 在 线 用 户 集群 行为 和 信任 关系 提供 了 


结果 表明 ， 在 建立 信任 关系 前 ， 用 户 打分 行为 中 的 长 记忆 
效应 随时 间 增 长 而 迅速 衰减 ， 于 建立 信任 关系 时 达到 最 低 ， 而 
在 建立 信任 关系 后 逐渐 恢复 。 

2) 零 模型 (Null Models) 

本 文 建立 两 个 零 模型 以 对 比 实证 结果 ， 建 立 过 程 如 下 。 
首先 ,在 两 个 零 模 型 中 ,用 户 和 评论 数据 与 实证 数据 一 致 。 
其 次 ， 用 户 对 评论 的 打分 关系 以 及 用 户 之 间 的 信任 关系 不 变 。 
在 Null Model I 中 ， 将 用 户 打 分 时 间 序 列 随机 打 乱 ， 而 用 户 和 
评论 的 对 应 关系 保持 不 变 ， 因 此 ， 用 户 打 分 行为 的 时 序 特性 被 
移 除 。 在 Null Model I 中 ， 将 用 户 建立 信任 关系 的 时 间 序 列 随 
机 打 乱 ; 因此 用 户 建 立信 任 关 系 的 时 序 特性 被 移 除 .Null Models 
的 结果 均 取 100 次 独立 实验 的 平均 值 。 

如 图 3 (a) 所 示 , Null Model I 中 ,用 户 建 立信 任 关 系 前 后 
的 赫 斯 特 指数 值 随 着 时 间 变 化 几乎 稳定 不 变 在 0.5 附近 。 意 味 
着 , Null ModelI 中 ,用 户 随机 打分 行为 在 建立 信任 关系 前 后 均 
不 存在 长 记忆 效应 。 与 实证 结果 对 比 可 知 ， 实 证 结果 来 自 于 真 
是 用 户 打 分 行为 ， 而 无 法 产生 于 用 户 随机 行为 。 
如 图 3 (b) 所 示 ，NullModelII 中 ， 用 户 建立 信任 关系 前 

后 的 赫 斯 特 指数 值 随时 间 变 化 几乎 稳定 不 变 在 0.6 附近 。 意 味 

D 集群 行为 分 析 着 ， 在 Null Model II 中， 用 户 打 分 行为 在 非 信 任 关 系 建立 时 间 

如 图 2 所 示 ， 用 户 在 建立 信任 关系 前 ， 整 体 打分 行为 的 平 前 后 的 长 记忆 效应 并 未 发 生 明 显 变化 。 与 实证 结果 对 比 可 知 ， 
均 赫 斯 特 指数 (8*(At)) 随 时 间 增加 而 减 小 (8.06%)， 在 建立 信 实证 结果 确实 表现 了 用 户 打分 行 与 在 信任 关系 建立 之 间 具 有 相 
任 关系 时 达到 最 小 值 (0.5716)， 并 在 建立 信任 关系 后 又 逐渐 增 。” 关 关系 。 


dg gritos 引用 源 。 


该 数据 集 包 含 415 076 个 用 户 , 13664916 条 关于 1560182 
条 评论 的 打分 ， 以 及 717 620 条 信任 关系 。 整 个 数据 集 为 2001 
年 1 月 18 日 至 2003 年 8 月 12 日 ， 共 938 天 的 数据 记录 。 

实验 评估 前 ， 首 先 针对 数据 集中 存在 噪音 数据 现象 ， 本 文 
o us a A 
一 个 用 户 至 少 给 100 条 评论 进行 过 打分 并 且 至 少 建立 过 一 条 信 
任 关 系 ， 以 确保 实验 结果 的 准确 性 。 die 我 们 仅 考虑 在 
建立 信任 关系 前 后 至 少 每 周 进 行 过 1 条 打分 的 用 户 。 

3.2 ”相对 时 间 转 换 

本 文 仅 关 注 用 户 建立 信任 关系 前 后 的 打分 行为 长 记忆 效应 
的 变化 ， 并 定义 相对 时 间 At， 以 方便 进行 前 后 赫 斯 特 指 数 的 变 
化 对 比 。 首 先 ， 以 用 户 信任 关系 建立 时 间 为 0 时 刻 CAE = 0), 
则 建立 信任 关系 前 2 周 即 为 At = -1， 后 2 周 即 为 At = 1。 以 此 
类 推 ， 将 原 数 据 集 中 时 间 标 转化 为 相对 时 间 Ate 
{-7, —6, .…,0, …,6,7}， 则 信任 关系 的 时 间 间 隔 转 化 为 相对 时 间 
窗口 -7 到 7。 因此， 本 文 考虑 了 第 50 天 至 第 866 天 的 信任 关 
系 ， 占 总 信任 关系 的 87.1%。 

3.8 ”实验 结果 分 析 
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大 (8.43%)。 具 体 计算 结果 如 表 1 所 示 。 0.55 
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3 66 4 20224 6 图 3 零 模型 Null Model) 中 赫 斯 特 指数 在 建立 信任 关系 前 后 的 动态 变 
At (E (a)Null Model I 中 用 户 打分 时 间 随 机 化 后 的 赫 斯 特 指数 变化 (bjNull 
妈 2 用 户 建立 信任 关系 前 后 长 记忆 效应 随时 间 的 变化 Model II 中 用 户 建立 信任 关系 时 间 随 机 化 后 的 赫 斯 特 指数 变化 
3) 用 户 打 分 行为 异 质 性 
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前 后 的 赫 斯 特 指数 ， 结 果 显 示 建 立信 任 关系 前 用 


HEA EATARRA 。 其 中 特别 的 是 ， 不 同 度 的 用 户 通常 户 打 分 行为 中 的 长 记忆 效应 明显 减弱 ( 赫 斯 特 指数 由 0.6176 减 
表现 出 不 同 的 行为 模式 em 。 因 此 ， 本 文 针对 不 同 度 用 ”小 8.06% 至 0.5716)， 而 建立 信任 关系 后 长 记忆 效应 逐步 恢复 
户 的 打分 行为 的 长 记忆 效应 进行 进一步 分 析 。 ( 赫 斯 特 指数 由 0.5176 增 大 8.43% 至 0.6197)。 其 次 ， 建 立 两 
首先 ,根据 用 户 打 分 数量 计算 用 户 度 ku 将 用 户 分 为 8 组 ， 个 零 模 型 ， 分 别 将 用 户 打分 和 信任 关系 的 时 间 随 机 化 ， 结 果 显 
使 第 组 用 户 的 用 户 度 ku € (1009 emn *G70d, 1 9logktmn d], 示 赫 斯 特 指数 分 别 稳 定 在 0.5~0.6。 与 实证 结果 对 比 可 知 ， 用户 
其 中 d = zlog ina, kumim 和 kumax 分 别 为 最 小 用 户 度 和 最 大 用 ”打分 行为 中 的 长 记忆 效应 的 变化 来 源 于 用 户 打分 行为 偏好 的 
广度。 则 每 组 的 平均 用 户 度 (ku) = XS kuř (A0. 致 性 变化 ， 与 其 信任 关系 建立 确实 存在 内 在 关联 性 。 最 后 ， 本 
quao) = py, "m i 文 进行 个 同 度 用 户 打 分 行为 的 异 质 性 ， saad 
NB 越 丰 富 的 用 户 , 在 建立 信任 关系 前 后 其 打分 行为 变动 程度 越 大 ， 
式 (1) ~ (4) 和 (6) 计算 每 组 用 户 的 平均 赫 斯 特 指数 ”用户 度 和 用 户 赫 斯 特 指数 减少 和 增加 的 相关 系数 分 别 为 0.9358 
(H(At))， 则 各 组 用 户 的 平均 赫 斯 特 指数 在 信任 关系 建立 前 后 。 和 0.9278。 
的 变化 A(HY(At)) 可 由 式 CD 计算 得 。 总 的 来 说 ， 本 文 对 在 线 用 集群 行为 及 其 信任 关系 进行 了 实 
A(HY(AD) = (HE (CAD) — (HX (0)) (7) 证 研究 。 实 证 结果 表明 ， 用 户 在 与 其 他 用 户 建 立信 任 关 系 时 打 
那么 ,平均 用 户 度 (ku 和 平均 赫 斯 特 指数 的 变化 A(! 必 (AD) 。 分 行为 的 一 致 性 显 闭 减 绊 。 因 此 ， 在 线 用 户 行为 分 析 研 究 中 
之 间 的 Pearson 相关 系数 ， 如 图 (4) 所 示 ， 随 用 户 度 增 大 ， 其 。 ”社交 因素 的 影响 个 应 该 被 忽视 。 社 交 关 系 对 用 户 偏好 的 影响 ， 
赫 斯 特 指数 变动 增 大 ， 打 分 行为 的 长 记忆 效应 在 建立 信任 关系 。 “也 应 访客 考虑 进 推荐 系统 、/ 各 策略 等 ， 从 而 能 为 在 线 用 户 提 
a 供 更 好 的 线 上 服务 。 但 是 ， 本 文 仍 存在 明显 的 局 限 性 。 首 先 ， 
前 后 波动 更 大 。 nn M» 
文中 使 用 DFA 进行 时 间 序 列 长 程 相 关 性 分 析 , 近期 出 现 了 许多 
0.15 改进 方法 进行 更 为 精确 的 分 析 ， 如 适用 于 交叉 关联 性 的 去 趋势 
交叉 关联 分 析 法 (DCCA ) PARASIA 和 适用 于 短 时 间 序 列 的 扩 
s HORT (DEA) “nn.。 此外， 本文 仅 针对 信任 关系 中 的 
入 言 任 关系 发 出 者 进行 了 研究 ， 而 未 涉及 被 信任 者 以 及 信任 关系 
E. 双方 之 间 的 互动 ， 这 也 是 本 文 下 一 步 的 研究 目标 。 
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